home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000176_timbl _Wed Jul 15 00:03:56 1992.msg < prev    next >
Internet Message Format  |  1992-11-30  |  3KB

  1. Return-Path: <timbl>
  2. Received: by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA02008; Wed, 15 Jul 92 00:03:56 MET DST
  4. Date: Wed, 15 Jul 92 00:03:56 MET DST
  5. From: timbl (Tim Berners-Lee)
  6. Message-Id: <9207142203.AA02008@ nxoc01.cern.ch >
  7. To: connolly@pixel.convex.com, www-talk@nxoc01.cern.ch
  8. Subject: Re: rethinking the HTML DTD.
  9.  
  10. Dan,
  11.  
  12. You say HTML is not SGML.  It is true that the HTML generted by the NeXT editor
  13. is not good. (example, lack of quotes around attributes which need them.)
  14. Hwoever, the current parser wil parse real SGML. 
  15.  
  16. I feel it IS important to keep the higher-level markup.
  17. Ypu ask, " Who really
  18. uses all the "format independent" features of WWW? I haven't seen
  19. anything that the RTF stylesheet features can't handle."
  20.  
  21. Well, the line-mode browser uses these features to generate a particular
  22. style which is different from the Xwindows style.  The LaTeX generation
  23. scripts which we use to make the "www book" use the high-level markup.
  24.  
  25. It is true that HTML does not have a deep structure, so that we can
  26. be compatible with software whichcannot handle nested elements.
  27. There is nothing wrong with having a simple SGML DTD as a basic case.
  28. SGML does not HAVE to be complicated.  You can use SGML to map any
  29. (non-overlapping) structure you like.
  30.  
  31. In the future, the web will inclued more complex DTDs, and dynamically
  32. loaded DTDs, and people will want to use the same parser for it.
  33.  
  34. You suggest that we should use RTF because it is better supported.
  35. Maybe we could use RTF in parallel in an experiment.  Soe problems
  36. I have are that
  37.  
  38. RTF uses a fudge of specially names styles to represent headings
  39. (for example, in Word) from which the WP deduces a structure
  40. (for outline mode, etc).
  41.  
  42. RTF has styles, but as far as I could see Microsoft RTF documents
  43. have teh actuall formatting information always tucked in there even
  44. if it there is a style name attached.
  45.  
  46. RTF has various extensions fopr handling for example embedded documents
  47. and links, but are these standard ized, or are different manufacturers
  48. going to use different tagsets in RTF just like SGML?
  49.  
  50.  
  51. Perhaps I am out of date in my knowledge of RTF (I certainly am).
  52. However, I see the WP manufacturers trying to escape from a position
  53. where they are historically bound to an RTF view, when they would like
  54. to be able to handle SGML.
  55.  
  56. If you're talking about displaying things, to make HTML into RTF
  57. is trivial.  You can make HTML into MIF too. You have to add
  58. style information of course.  When you go back you have to do this
  59. fudge of requiring the same style names to be used.
  60.  
  61. So I feel RTF would be a backward step. It is true that the current
  62. W3 software is at a point level with RTF rather than general SGML.
  63. But why tie ourselves to that point?
  64.  
  65.     Tim